課程名稱 |
資訊檢索與文字探勘導論 INTRODUCTION TO INFORMATION RETRIEVAL AND TEXT MINING |
開課學期 |
97-1 |
授課對象 |
管理學院 資訊管理學研究所 |
授課教師 |
陳建錦 |
課號 |
IM5030 |
課程識別碼 |
725EU3410 |
班次 |
|
學分 |
3 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期四6,7,8(13:20~16:20) |
上課地點 |
管二204 |
備註 |
本課程以英語授課。 限學士班三年級以上 且 限本系所學生(含輔系、雙修生) 總人數上限:25人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/971IRTM |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
本課程將介紹資訊檢索與文字探勘等研究議題,歡迎大三以上及研究所學生選修。 |
課程目標 |
本課程的第一部分將介紹傳統的資訊檢索技術,如文件的表示法
、關鍵字重要性、資訊檢索系統的評估方法。第二部分將涉及一些文字探勘的議題,如文件自動分類與分群、時件偵測與追蹤、文件摘要法等。藉此提供一套完整的資訊檢索與文字探勘介紹 |
課程要求 |
probability, programming language, data structure |
預期每週課後學習時數 |
|
Office Hours |
每週三 09:00~10:00 |
指定閱讀 |
|
參考書目 |
Christopher D. Manning,
Prabhakar Raghavan, and
Hinrich
Schutze, "Introduction to
Information Retrieval,"
Cambridge University Press.
2008. |
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
期中考 |
30% |
|
2. |
程式作業 |
30% |
(約4次) |
3. |
Term Project |
40% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
9/18 |
Syllabus,
Chapter 2, The Term Vocabulary,
Programming Assignment 1. |
第2週 |
9/25 |
PAT Tree and Chinese Keyword Extraction |
第3週 |
10/02 |
Scoring, Term Weighting and the Vector Space Model, Programming Assignment 2 |
第4週 |
10/09 |
Evaluation in Information Retrieval |
第5週 |
10/16 |
Relevance Feedback and Query Expansion |
第6週 |
10/23 |
Probabilistic Information Retrieval |
第7週 |
10/30 |
Language Models for Information Retrieval |
第8週 |
11/06 |
Text Classification and Naive Bayes |
第9週 |
11/13 |
Midterm |
第10週 |
11/20 |
Text Classification and Naive Bayes, Programming Assignment 3 |
第11週 |
11/27 |
Vector Space Classification |
第12週 |
12/04 |
Flat Clustering |
第13週 |
12/11 |
Flat Clustering |
第14週 |
12/18 |
Flat Clustering
Topic Detection and Incremental Clustering |
第15週 |
12/25 |
Hierarchical Clustering |
第17週 |
1/08 |
Link Analysis |
第18週 |
2009/01/15 |
Project Presentation |
|